Comparaison stations référentes VS les autres :

Dans ce document nous allons comparer les stations référentes, dites stations du réseau régional patrimonial. Elles sont censées avoir au moins 12 prelevement par an.

Stats déscriptive sur les stations de références
NbreAnMoy NbrePrlvtMoy NbreAnalyseMoy NbrePrlvtMoyParAn NbreAnalyseMoyParAn nbre_ME
12.1 186.3 45440.6 15.2 3730.9 32
Nombres de prelevement par années pour les stations référentes
code_station 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
04102500 12 NA 12 7 7 19 7 17 19 22 12 22
04102990 NA 12 NA NA 12 19 11 18 29 12 20 12
04104500 12 7 12 7 7 17 7 18 25 12 11 20
04108500 12 NA 12 7 7 12 6 12 16 12 12 20
04115200 12 7 12 7 7 12 6 12 18 12 12 19
04119300 NA 3 1 7 7 10 7 12 12 12 12 12
04123980 12 9 12 7 7 12 7 12 14 12 12 12
04125800 12 12 12 7 7 12 6 12 14 18 16 12
04132000 12 9 21 19 17 18 8 19 19 23 12 22
04132500 12 16 21 19 17 17 7 18 19 22 12 22
04133075 12 10 12 19 19 21 19 24 24 22 12 11
04134010 NA 21 NA 17 19 18 6 18 20 12 12 4
04134700 19 21 18 20 19 19 18 19 18 17 18 18
04135000 12 NA 12 7 7 19 7 18 20 22 12 18
04143150 12 NA 12 7 7 12 7 12 14 12 21 24
04145000 12 8 21 20 19 12 7 12 12 24 12 25
04146000 12 8 18 19 19 19 18 19 21 16 18 18
04146500 12 6 20 18 19 19 NA 18 19 12 16 16
04148570 12 7 7 7 7 12 5 12 12 12 18 11
04148587 NA 8 9 19 19 18 6 18 19 12 12 12
04149400 NA 3 1 NA NA 12 NA 12 12 12 12 12
04150515 12 NA NA NA NA 9 NA 18 19 12 12 12
04152000 12 6 21 19 19 19 NA 18 19 16 12 15
04153160 12 7 6 7 7 17 4 18 19 10 12 9
04155500 12 6 17 20 19 18 18 18 21 17 18 18
04158000 12 7 7 7 8 19 7 18 19 12 12 12
04215485 12 NA 12 7 7 19 7 17 18 23 12 18
044000001 12 12 12 12 12 13 18 12 15 16 12 12
044000087 12 10 12 12 12 15 17 13 17 13 12 12
049000402 16 15 16 21 16 14 17 12 14 13 12 12
049000461 15 14 15 17 14 19 21 16 13 14 13 12
049000795 12 9 9 13 11 15 10 12 11 11 12 11
072000052 12 12 12 12 14 12 15 12 12 12 13 11
## `summarise()` ungrouping output (override with `.groups` argument)
Stats déscriptive sur les autres stations
NbreAnMoy NbrePrlvtMoy NbreAnalyseMoy NbrePrlvtMoyParAn NbreAnalyseMoyParAn nbre_ME
6 50.8 7973.3 7.4 1187.8 311
## Adding missing grouping variables: `mois`

## Adding missing grouping variables: `mois`

## Joining, by = "code_station"

dates d’apparitions des molécules….

Analyses des pesticides sur les stations référentes :

On commence par selectionner les 15 substances les plus quantifiées entre 2007 et 2017

15 substances les plus quantifiées

Taux de quantification

Quantification selon les années :

Nombres de prelevement supérieur à 0 :

Passons aux pesticides définit comme prioritaire ou dangereux par l’Arrêté du 07/09/15 :

Quantification selon les années :

Nombres de prelevement supérieur à 0 :

Analyses des pesticides sur les autres stations :

Analyses des pesticides sur les autres stations avec les 15 substances les plus quantifiées

15 substances les plus quantifiées

Taux de quantification

Quantification selon les années :

Nombres de prelevement supérieur à 0 :

Passons aux pesticides définit comme prioritaire ou dangereux par l’Arrêté du 07/09/15 :

Quantification selon les années :

Nombres de prelevement supérieur à 0 :

Descriptive Stations REFS :

Moy Mensuelle de chaque pesticides :

Moy Mensuelle + P90 de chaque pesticides separés:

Cumul par mois des principales substances ::

Notes des stations référentes :

Notes des substances sur stations reférentes :

Avec le nombres de substances total par année.

Descriptive Stations Autres :

Moy Mensuelle de chaque pesticides :

Pesticides Separés :

Cumul par mois des principales substances ::

Notes des stations Non-référentes :

Notes des substances sur stations Non-reférentes :

Avec le nombres de substances analysée par années.

Depassement du PNEC

Cote à cote :

Sur stations referentes :

Sur autres stations :

IPCE

## `summarise()` regrouping output by 'annee' (override with `.groups` argument)
## `summarise()` regrouping output by 'annee' (override with `.groups` argument)

Depassement du NQE_CMA et NQE_MA :

Station REF

Station Non-REF

{-}

Le seqEau :

Station REF

Station Non-REF

---
title: "Analyses stations ref vs non-ref."
author: "Simon Durand"
date : "`r format(Sys.time(), '%d %B, %Y')`"
output:
  html_document: 
    offline: false
    toc: true
    toc_float: true
    toc_depth: 4
    code_download: true
  pdf_document: default 
bibliographie: rmarkdownbiblio.bib
---

```{r setup, echo=FALSE}
 knitr::opts_chunk$set(echo = FALSE, warning = FALSE)
 #remotes::install_git(url = "https://gitlab.com/dreal-datalab/drealdown")

 #rmarkdown::render()
 #toc_float: yes
```
 

```{r include == "FALSE", message = FALSE}

#### Library ####
#devtools::install_github("walkerke/bsselectR")
#library(drealdown)

library(trend)
library(tidyverse)
library(fcuk)
library(car)
library(stringr)
library(bsselectR)
library(readxl)
library(stringr)
library(packrat)
library(data.table)
library(factoextra)
library(cluster)
library(FactoMineR)
library(gridExtra)
library(dendextend)
library(ggplot2)
library(knitr)
library(DT)
library(kableExtra)

load(file ="data/analyse_Autre.RData")
load(file ="data/analyse_ref.RData")
source("R/tab_global.R")


```

```{css, echo=FALSE}
p {
  font-size: 20px;
}

h1, h2, h3 { 
  text-align: center;
}
```

# Comparaison stations référentes VS les autres : 

Dans ce document nous allons comparer les stations référentes, dites stations du réseau régional patrimonial. Elles sont censées avoir au moins 12 prelevement par an.


```{r}
station <- bind_rows(autre_station,ref_station)

autre_station_nb <- autre_station %>%  inner_join(nb_STATION_anne_and_prelevement,by="code_station")


kable(stat_station_ref[], caption = "Stats déscriptive sur les stations de références",digits = 1) %>%  kable_styling(bootstrap_options = c("striped", "condensed", "responsive"), full_width = F,fixed_thead = T)




kable(prvlt_par_an_ref_station[], caption = "Nombres de prelevement par années pour les stations référentes",digits = 1) %>%  kable_styling(bootstrap_options = c("striped", "condensed", "responsive"), full_width = F,fixed_thead = T)


nb_ME <- autre_station_nb %>% group_by(code_masse_eau) %>% filter(code_masse_eau != "NULL") %>% distinct() %>%  summarise( )
nb_ME <- as.data.frame(nrow(nb_ME)) %>%  rename( nbre_ME = `nrow(nb_ME)` )

stat_station_autre <- autre_station_nb %>%
  summarise(NbreAnMoy = mean(nb_anne_station),
            NbrePrlvtMoy = mean(nb_prelevement_station),
            NbreAnalyseMoy = mean(nb_analyse_station),
            NbrePrlvtMoyParAn = mean(nb_moy_prev_an),
            NbreAnalyseMoyParAn = mean(nb_moy_anal_an))
stat_station_autre <- bind_cols(stat_station_autre,nb_ME)

kable(stat_station_autre[], caption = "Stats déscriptive sur les autres stations ",digits = 1) %>%  kable_styling(bootstrap_options = c("striped", "condensed", "responsive"), full_width = F,fixed_thead = T)


carte_chaleur_ref <- ref_analyse_tot %>% left_join(ref_prelevement,by="code_prelevement") %>% 
  left_join(ref_station,by="code_station") %>%
  mutate(annee = year(date_prelevement), mois = month(date_prelevement)) %>% 
  group_by(annee,mois) %>% 
  select(code_station,date_prelevement,annee) %>%
  distinct() %>% count(name="nb_prlvt")  
  #group_by(annee,mois) %>% 
  #mutate(nb_prlvt = mean(nb_prlvt)) %>%  ungroup()  Inutile de faire la moyenne....
ggplot(carte_chaleur_ref, aes(annee, mois, group=nb_prlvt, colour=nb_prlvt))  + geom_point() + ggtitle("Carte de chaleur du nbre de prelevement pour les stations refs") +scale_color_gradientn(colours = rainbow(6))
autre_analyse_tot2 <- autre_analyse_tot %>% select(-code_station)
carte_chaleur_non_ref <- autre_analyse_tot2 %>% select(-date_prelevement) %>% left_join(autre_prelevement,by="code_prelevement") %>% 
  left_join(autre_station,by="code_station") %>%
  mutate(annee = year(date_prelevement), mois = month(date_prelevement)) %>% 
  group_by(annee,mois) %>% 
  select(code_station,date_prelevement,annee) %>%
  distinct() %>% count(name="nb_prlvt")  

ggplot(carte_chaleur_non_ref, aes(annee, mois, group=nb_prlvt, colour=nb_prlvt))  + geom_point() + ggtitle("Carte de chaleur du nbre de prelevement pour les stations Non-refs") +scale_color_gradientn(colours = rainbow(6))
```



```{r}
station_referente_nul <- ref_station %>% 
  select(code_station,libelle_station) %>% 
  inner_join(nb_STATION_anne_and_prelevement)

stats_station2 <-  station  %>%
  left_join(nb_STATION_anne_and_prelevement,by="code_station") %>% 
  filter(!is.na(nb_analyse_station))  %>% 
  mutate(nb_moy_prev_an = round(nb_moy_prev_an,0)) %>%  
  mutate(station_reference_pesticides = ifelse(station_reference_pesticides == "TRUE", "stations reférentes","stations pas reférentes"))

ggplot(stats_station2, aes(nb_moy_prev_an, fill = station_reference_pesticides)) +
  geom_bar() + 
ggtitle("Nbre de station par moy de prélevement par ans ") +
  ylab("Nombre de stations") +
  xlab("Nombre de prélevement par an")
```
 
### dates d'apparitions des molécules....


# Analyses des pesticides sur les stations référentes : 

## On commence par selectionner les 15 substances les plus quantifiées entre 2007 et 2017  {.tabset .tabset-pills}

### 15 substances les plus quantifiées


```{r}
 ref_Pesticide_plus_analyse <- ref_Pesticide_plus_analyse %>% arrange(desc(taux_quant)) %>% left_join(parametre %>% select(code_parametre,Usage1,dangereuse_prioritaire,EtatChimiqueOuBiologique),by="code_parametre")
# #parametre$EtatChimiqueOuBiologique
# ggplot(ref_Pesticide_plus_analyse,aes(nom_parametre,taux_quant)) +
# ggtitle("Top 15 pesticides les + quantifiés") +
#   ylab("Taux de quantification") +
#   xlab("Nom de la substance") +
#         geom_col(na.rm=TRUE) + 
#   theme(axis.title.x = element_text(face="bold", colour="#990000", size=20),
#            axis.text.x  = element_text(angle=90, vjust=0.5, size=16))
#F_parametre$Interdiction
ref_Pesticide_plus_analyse <- ref_Pesticide_plus_analyse %>% left_join(F_parametre %>% select(code_parametre,Interdiction),by="code_parametre")
ggplot(ref_Pesticide_plus_analyse) +
 aes(x = nom_parametre, fill = Interdiction, weight = taux_quant) +
 geom_bar() +
 scale_fill_hue() +
 labs(title = "Top 15 des substances les +
 quantifiés") +
 theme_minimal() +
    theme(axis.title.x = element_text(face="bold", colour="#990000", size=20),
           axis.text.x  = element_text(angle=90, vjust=0.5, size=16))

```

### Taux de quantification

```{r}
ref_Pesticide_plus_analysetotal_par_annee$annee <- as.factor(ref_Pesticide_plus_analysetotal_par_annee$annee)
ref_Pesticide_plus_analysetotal_par_annee %>%
 #filter(P90_month >= 0 & P90_month <= 2.95) %>%
 ggplot() +
 aes(x = annee, y = taux_quant, colour = nom_parametre, group = nom_parametre) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Année", y = "Taux de quantification", title = "Quantification selon les années", subtitle = "Top 15 substances") +
 theme_minimal()


# ref_Pesticide_plus_analyse_chaq_an %>%
#  #filter(P90_month >= 0 & P90_month <= 2.95) %>%
#  ggplot() +
#  aes(x = annee, y = taux_quant, colour = nom_parametre, group = nom_parametre) +
#  geom_line(size = 1L) +
#  scale_color_hue() +
#  labs(x = "Année", y = "Taux de quantification", title = "Quantification selon les années", subtitle = "Top 20 substances") +
#  theme_minimal()

```

### Quantification selon les années :

```{r}
ref_nb_analyse_Pesticide_plus_analyse_par_annee$annee <- as.factor(ref_nb_analyse_Pesticide_plus_analyse_par_annee$annee)
ref_nb_analyse_Pesticide_plus_analyse_par_annee %>%
 #filter(P90_month >= 0 & P90_month <= 2.95) %>%
 ggplot() +
 aes(x = annee, y = nb_analyse, colour = nom_parametre, group = nom_parametre) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Année", y = "Nombres de quantifications", title = "Nombres de quantification selon les années", subtitle = "Top 15 substances") +
 theme_minimal()


```

### Nombres de prelevement supérieur à 0 :

```{r}

ref_nb_analyse_par_qtite_resultat$annee <- as.factor(ref_nb_analyse_par_qtite_resultat$annee)
ref_nb_analyse_par_qtite_resultat %>% 
 #filter(P90_month >= 0 & P90_month <= 2.95) %>%
 ggplot() +
 aes(x = annee, y = nb_analyse, colour = quantite_analyse, group = quantite_analyse) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Année", y = "Nombres de quantifications", title = "Nombres de quantification selon les années", subtitle = "Top 15 substances") +
 theme_minimal()
```

## {-}

## Passons aux pesticides définit comme prioritaire ou dangereux par l'Arrêté du 07/09/15 : {.tabset .tabset-pills}


### Quantification selon les années :

```{r}
ref_nb_analyse_Pesticide_DangPrio_par_annee$annee <- as.factor(ref_nb_analyse_Pesticide_DangPrio_par_annee$annee)
ref_nb_analyse_Pesticide_DangPrio_par_annee %>%
 #filter(P90_month >= 0 & P90_month <= 2.95) %>%
 ggplot() +
 aes(x = annee, y = nb_analyse, colour = nom_parametre, group = nom_parametre) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Année", y = "Nombres de quantifications", title = "Nombres de quantification selon les années", subtitle = "Substance prio ou dangereuses") +
 theme_minimal()


```

### Nombres de prelevement supérieur à 0 :

```{r}

ref_nb_analyse_Pesticide_DangPrio_par_qtite_resultat$annee <- as.factor(ref_nb_analyse_Pesticide_DangPrio_par_qtite_resultat$annee)
ref_nb_analyse_Pesticide_DangPrio_par_qtite_resultat %>% 
 #filter(P90_month >= 0 & P90_month <= 2.95) %>%
 ggplot() +
 aes(x = annee, y = nb_analyse, colour = quantite_analyse, group = quantite_analyse) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Année", y = "Nombres de quantifications", title = "Nombres de quantification selon les années", subtitle = "Substance prio ou dangereuses") +
 theme_minimal()
```

## {-}

# Analyses des pesticides sur les autres stations : 

## Analyses des pesticides sur les autres stations avec les 15 substances les plus quantifiées  {.tabset .tabset-pills}

<!-- , puis leurs taux par année. -->

### 15 substances les plus quantifiées

```{r}
 autre_Pesticide_plus_analyse <- autre_Pesticide_plus_analyse %>% arrange(desc(taux_quant)) %>% left_join(parametre %>% select(code_parametre,Usage1,dangereuse_prioritaire,EtatChimiqueOuBiologique),by="code_parametre")

ggplot(autre_Pesticide_plus_analyse) +
 aes(x = nom_parametre, fill = EtatChimiqueOuBiologique, weight = taux_quant) +
 geom_bar() +
 scale_fill_hue() +
 labs(title = "Top 15 des substances les +
 quantifiés") +
 theme_minimal() +
    theme(axis.title.x = element_text(face="bold", colour="#990000", size=20),
           axis.text.x  = element_text(angle=90, vjust=0.5, size=16))

```

### Taux de quantification

```{r}

autre_Pesticide_plus_analysetotal_par_annee$annee <- as.factor(autre_Pesticide_plus_analysetotal_par_annee$annee)
autre_Pesticide_plus_analysetotal_par_annee %>%
 ggplot() +
 aes(x = annee, y = taux_quant, colour = nom_parametre, group = nom_parametre) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Année", y = "Taux de quantification", title = "Quantification selon les années", subtitle = "Top 15 substances") +
 theme_minimal()

```

### Quantification selon les années :

```{r}
autre_nb_analyse_Pesticide_plus_analyse_par_annee$annee <- as.factor(autre_nb_analyse_Pesticide_plus_analyse_par_annee$annee)
autre_nb_analyse_Pesticide_plus_analyse_par_annee %>%
 #filter(P90_month >= 0 & P90_month <= 2.95) %>%
 ggplot() +
 aes(x = annee, y = nb_analyse, colour = nom_parametre, group = nom_parametre) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Année", y = "Nombres de quantifications", title = "Nombres de quantification selon les années", subtitle = "Top 15 substances") +
 theme_minimal()


```

### Nombres de prelevement supérieur à 0 :

```{r}

autre_nb_analyse_par_qtite_resultat$annee <- as.factor(autre_nb_analyse_par_qtite_resultat$annee)
autre_nb_analyse_par_qtite_resultat %>% 
 #filter(P90_month >= 0 & P90_month <= 2.95) %>%
 ggplot() +
 aes(x = annee, y = nb_analyse, colour = quantite_analyse, group = quantite_analyse) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Année", y = "Nombres de quantifications", title = "Nombres de quantification selon les années", subtitle = "Top 15 substances") +
 theme_minimal()
```

## {-}


## Passons aux pesticides définit comme prioritaire ou dangereux par l'Arrêté du 07/09/15 : {.tabset .tabset-pills}


### Quantification selon les années :

```{r}
autre_nb_analyse_Pesticide_DangPrio_par_annee$annee <- as.factor(autre_nb_analyse_Pesticide_DangPrio_par_annee$annee)
autre_nb_analyse_Pesticide_DangPrio_par_annee %>%
 #filter(P90_month >= 0 & P90_month <= 2.95) %>%
 ggplot() +
 aes(x = annee, y = nb_analyse, colour = nom_parametre, group = nom_parametre) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Année", y = "Nombres de quantifications", title = "Nombres de quantification selon les années", subtitle = "Substance prio ou dangereuses") +
 theme_minimal()

```

### Nombres de prelevement supérieur à 0 :

```{r}

autre_nb_analyse_Pesticide_DangPrio_par_qtite_resultat$annee <- as.factor(autre_nb_analyse_Pesticide_DangPrio_par_qtite_resultat$annee)
autre_nb_analyse_Pesticide_DangPrio_par_qtite_resultat %>% 
 #filter(P90_month >= 0 & P90_month <= 2.95) %>%
 ggplot() +
 aes(x = annee, y = nb_analyse, colour = quantite_analyse, group = quantite_analyse) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Année", y = "Nombres de quantifications", title = "Nombres de quantification selon les années", subtitle = "Substance prio ou dangereuses") +
 theme_minimal()
```

## {-}

## Descriptive Stations REFS : {.tabset .tabset-pills}

### Moy Mensuelle de chaque pesticides : 

```{r}

moy_mens <- Moy_mois_ensemble_Station(table_station = ref_station,table_prelevement = ref_prelevement,
                                      table_analyse = ref_analyse) %>% filter(!is.na(code_parametre)) %>% 
  left_join(ref_parametre %>% 
              select(code_parametre,nom_parametre),by="code_parametre")%>%
  filter(!is.na(nom_parametre)) %>% 
  ungroup() %>% 
  select(-code_parametre) #%>% 

moy_mens %>%
 filter(mean_month >= 0 & mean_month <= 2.95) %>%
 ggplot() +
 aes(x = date, y = mean_month, colour = nom_parametre, group = nom_parametre) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Date", y = "Moyennes mensuelles", title = "Moyenne sur stations reférentes", subtitle = "Top 15 substances") +
 theme_minimal()

```

### Moy Mensuelle + P90 de chaque pesticides separés: 


```{r}
state_plots <- paste0(list.files("plots/param_station_ref_Moy_month", full.names = TRUE))
names(state_plots) <- str_replace_all(state_plots, 
                                      c("\\.png" = "", 
                                        "plots/param_station_ref_Moy_month" = ""))

bsselect(state_plots, type = "img", selected = "2-hydroxy atrazine", 
         live_search = TRUE, show_tick = TRUE)

```

<!-- ### Le P90 :  -->

<!-- ```{r} -->

<!-- P90_mens %>% -->
<!--  filter(P90_month >= 0 & P90_month <= 2.95) %>% -->
<!--  ggplot() + -->
<!--  aes(x = date, y = P90_month, colour = nom_parametre, group = nom_parametre) + -->
<!--  geom_line(size = 1L) + -->
<!--  scale_color_hue() + -->
<!--  labs(x = "Date", y = "P90 mensuelles", title = "P90 sur stations reférentes", subtitle = "Top 15 substances") + -->
<!--  theme_minimal() -->
<!-- ``` -->

### Cumul par mois des principales substances ::

```{r}
cumul_top20 <- ref_analyse %>% 
  left_join(prelevement %>% select(code_prelevement,date_prelevement),by="code_prelevement") %>% 
  inner_join(ref_parametre,by="code_parametre") %>% 
  mutate(annee=year(date_prelevement),month=month(date_prelevement)) %>% 
  group_by(annee,month) %>% 
  mutate(cumul_mois = sum(resultat_analyse)) %>% 
  select(annee,month,cumul_mois,date_prelevement) %>% 
  distinct()


cumul_top20_anal <- ref_analyse %>% 
   left_join(prelevement %>% select(code_prelevement,date_prelevement),by="code_prelevement") %>% 
  inner_join(ref_parametre,by="code_parametre") %>% 
  mutate(annee=year(date_prelevement),month=month(date_prelevement)) %>% 
  group_by(annee,month) %>% 
  count(name = "nb_analyse") %>% 
  #select(annee,month,nb_analyse,date_prelevement) %>% 
  distinct()

cumul_top20 <- cumul_top20 %>% left_join(cumul_top20_anal,by=c("annee","month"))

remove(cumul_top20_anal)

cumul_top20 %>%
 ggplot() +
 aes(x = date_prelevement)+       #, colour = nom_parametre, group = nom_parametre) +
  geom_line(aes(y = cumul_mois, color = "Cumul")) + 
  geom_line(aes(y = nb_analyse, color="Nb_analyses"), linetype="twodash")  +
 #scale_color_hue() +
    scale_color_manual(values = c("darkred", "steelblue")) +
 labs(x = "Date", y = "cumul mensuelles", title = "Cumul des substances sur les stations refs", subtitle = "Top 15 substances") +
 theme_minimal()


```

### Notes des stations référentes :

```{r}

note_station <-  nb_STATION_anne_and_prelevement %>% 
  inner_join(ref_station,by="code_station") %>% 
  mutate(note_prev = ifelse(nb_moy_prev_an<3,0,
                           ifelse(nb_moy_prev_an<6,1,
                                  ifelse(nb_moy_prev_an<12,2,3)))) %>% 
  mutate(note_nb_substance =  ifelse(nb_analyses_recherches<50,0,
                                  ifelse(nb_analyses_recherches<100,1,
                                      ifelse(nb_analyses_recherches<200,2,3)))) %>% 
  select(code_station,note_nb_substance,note_prev) %>% 
      mutate(note_total_stat = ifelse(note_nb_substance + note_prev>4,"forte",
                                 ifelse(note_nb_substance + note_prev>2,"moyen",
                                        "faible")))

DT::datatable(note_station,caption = "Notes des différentes stations référentes")
nb_note <- note_station %>% group_by(note_total_stat) %>% 
  count(name="nb_station")
note_station$note_total_stat <- as.factor(note_station$note_total_stat)
ggplot(data = nb_note, aes(x=note_total_stat)) +
  geom_col(aes(y=nb_station))

```

### Notes des substances sur stations reférentes :

```{r}
note_substance <- ref_station %>% left_join(ref_prelevement,by="code_station") %>% 
  left_join(ref_analyse_tot ,by="code_prelevement") %>% 
  mutate(annee = year(date_prelevement)) %>% 
  select(code_parametre,annee,code_station) %>% 
  distinct() %>% 
  group_by(code_parametre,annee) %>% 
  count(name="nb_station") 
  
note_substance_2 <- ref_station %>% left_join(ref_prelevement,by="code_station") %>% 
  left_join(ref_analyse_tot,by="code_prelevement") %>% 
  mutate(annee = year(date_prelevement)) %>% 
  select(code_parametre,annee,code_prelevement) %>% 
  distinct() %>% 
  group_by(code_parametre,annee) %>% 
  count(name="frq_prelevement") 

note_substance_3 <- ref_station %>% left_join(ref_prelevement,by="code_station") %>% 
  left_join(ref_analyse_tot,by="code_prelevement") %>% 
  mutate(annee = year(date_prelevement)) %>% 
  select(code_parametre,annee) %>% 
  distinct() %>% 
  group_by(annee) %>% 
  count(name="nb_substance") 

note_substance <- note_substance %>% 
  left_join(note_substance_2,by=c("code_parametre","annee")) %>% 
  inner_join(parametre,by="code_parametre") %>% 
  mutate(note_station = ifelse(nb_station<20,0,
                              ifelse(nb_station<50,1,
                                     ifelse(nb_station<100,2,3)))) %>% 
  mutate(frq_prvlt = frq_prelevement/nb_station) %>% 
  mutate(note_frq = ifelse(frq_prvlt<2,0,
                              ifelse(frq_prvlt<6,1,
                                     ifelse(frq_prvlt<10,2,3)))) %>% 
  ungroup() %>% 
  select(code_parametre,note_station,note_frq,annee) %>% 
  mutate(note_total_substance = ifelse(note_station + note_frq>4,"forte",
                                 ifelse(note_station + note_frq>2,"moyen",
                                        "faible"))) %>% 
  left_join(note_substance_3,by="annee") 

remove(note_substance_2)

DT::datatable(note_substance,caption = "Notes des différentes substances sur stations référentes")


note_substance$note_total_substance <- as.factor(note_substance$note_total_substance)
# ggplot(data=note_substance, aes(annee))+
#   geom_bar(aes(fill=as.factor(note_total_substance)), position="fill")

# ggplot(data=note_substance,
#        aes(x=annee,y=(..count..)/sum(..count..),
#            fill = note_total_substance)) + 
#   geom_bar(width = 0.9) +
#    geom_text(aes(label=nb_substance), vjust=0)

ggplot(note_substance, aes(annee, nb_substance, fill=note_total_substance))+
    geom_bar(stat="identity") +
    geom_text(aes(label=nb_substance), vjust=-12, size=3, hjust=1)
```

Avec le nombres de substances total par année.

## {-}

## Descriptive Stations Autres : {.tabset .tabset-pills}

### Moy Mensuelle de chaque pesticides : 

```{r}
moy_mens <- Moy_mois_ensemble_Station(table_station = autre_station,table_prelevement = autre_prelevement,
                                      table_analyse = ref_analyse) %>% filter(!is.na(code_parametre)) %>% 
  left_join(autre_parametre %>% 
              select(code_parametre,nom_parametre),by="code_parametre")%>%
  ungroup() %>% 
  select(-code_parametre) #%>% 

moy_mens %>%
 filter(mean_month >= 0 & mean_month <= 2.95) %>%
 ggplot() +
 aes(x = date, y = mean_month, colour = nom_parametre, group = nom_parametre) +
 geom_line(size = 1L) +
 scale_color_hue() +
 labs(x = "Date", y = "Moyennes mensuelles", title = "Moyenne sur stations non-reférentes", subtitle = "Top 15 substances") +
 theme_minimal()

```

### Pesticides Separés :

```{r}
state_plots <- paste0(list.files("plots/param_station_NON_ref_Moy_month", full.names = TRUE))
names(state_plots) <- str_replace_all(state_plots, 
                                      c("\\.png" = "", 
                                        "plots/param_station_NON_ref_Moy_month" = ""))

bsselect(state_plots, type = "img", selected = "2-hydroxy atrazine", 
         live_search = TRUE, show_tick = TRUE)
```

```{r}
# state_plots <- paste0(list.files("plots/param_station_NON_ref_Moy_month", full.names = TRUE))
# names(state_plots) <- str_replace_all(state_plots, 
#                                       c("\\.png" = "", 
#                                         "plots/param_station_NON_ref_Moy_month" = ""))
# 
# bsselect(state_plots, type = "img", selected = "2-hydroxy atrazine", 
#          live_search = TRUE, show_tick = TRUE)

```

<!-- ### Le P90 :  -->

<!-- ```{r} -->
<!-- P90_mens <- P90_mois_ensemble_Station(table_station = autre_station,table_prelevement = autre_prelevement, -->
<!--                                       table_analyse = autre_analyse %>% select(-date_prelevement)) %>% filter(!is.na(code_parametre)) %>%  -->
<!--   left_join(autre_parametre %>%  -->
<!--               select(code_parametre,nom_parametre),by="code_parametre")%>% -->
<!--   ungroup() %>%  -->
<!--   select(-code_parametre) #%>%  -->

<!-- P90_mens %>% -->
<!--  filter(P90_month >= 0 & P90_month <= 2.95) %>% -->
<!--  ggplot() + -->
<!--  aes(x = date, y = P90_month, colour = nom_parametre, group = nom_parametre) + -->
<!--  geom_line(size = 1L) + -->
<!--  scale_color_hue() + -->
<!--  labs(x = "Date", y = "P90 mensuelles", title = "P90 sur stations non-reférentes", subtitle = "Top 15 substances") + -->
<!--  theme_minimal() -->

<!-- ``` -->

### Cumul par mois des principales substances ::

```{r}
cumul_top20 <- autre_analyse %>% 
  mutate(annee=year(date_prelevement),month=month(date_prelevement)) %>% 
  group_by(annee,month) %>% 
  mutate(cumul_mois = sum(resultat_analyse)) %>% 
  select(annee,month,cumul_mois,date_prelevement) %>% 
  distinct()

cumul_top20_anal <- autre_analyse %>% 
  mutate(annee=year(date_prelevement),month=month(date_prelevement)) %>% 
  group_by(annee,month) %>% 
  count(name = "nb_analyse") %>% 
  #select(annee,month,nb_analyse,date_prelevement) %>% 
  distinct()

cumul_top20 <- cumul_top20 %>% left_join(cumul_top20_anal,by=c("annee","month"))

remove(cumul_top20_anal)

cumul_top20 %>%
 ggplot() +
 aes(x = date_prelevement)+       #, colour = nom_parametre, group = nom_parametre) +
  geom_line(aes(y = cumul_mois, color = "Cumul")) + 
  geom_line(aes(y = nb_analyse, color="Nb_analyses"), linetype="twodash")  +
 #scale_color_hue() +
    scale_color_manual(values = c("darkred", "steelblue")) +
 labs(x = "Date", y = "cumul mensuelles", title = "Cumul des substances sur les stations Non-refs", subtitle = "Top 15 substances") +
 theme_minimal()

```

### Notes des stations Non-référentes :

```{r}

note_station <-  nb_STATION_anne_and_prelevement %>% 
  inner_join(autre_station,by="code_station") %>% 
  mutate(note_prev = ifelse(nb_moy_prev_an<3,0,
                           ifelse(nb_moy_prev_an<6,1,
                                  ifelse(nb_moy_prev_an<12,2,3)))) %>% 
  mutate(note_nb_substance =  ifelse(nb_analyses_recherches<50,0,
                                  ifelse(nb_analyses_recherches<100,1,
                                      ifelse(nb_analyses_recherches<200,2,3)))) %>% 
  select(code_station,note_nb_substance,note_prev) %>% 
    mutate(note_total_stat = ifelse(note_nb_substance + note_prev>4,"forte",
                                 ifelse(note_nb_substance + note_prev>2,"moyen",
                                        "faible")))


DT::datatable(note_station,caption = "Notes des différentes stations Non-référentes")
nb_note <- note_station %>% group_by(note_total_stat) %>% 
  count(name="nb_station") %>% filter(!is.na(note_total_stat))
note_station$note_total_stat <- as.factor(note_station$note_total_stat)
ggplot(data = nb_note, aes(x=note_total_stat)) +
  geom_col(aes(y=nb_station))

```


### Notes des substances sur stations Non-reférentes :


```{r}
# autre_analyse_tot2 <- autre_analyse_tot %>% select(-c(date_prelevement,code_station))
# note_substance <- autre_station %>% left_join(autre_prelevement,by="code_station") %>% 
#   left_join(autre_analyse_tot2 ,by="code_prelevement") %>% 
#   mutate(annee = year(date_prelevement)) %>% 
#   select(code_parametre,annee,code_station) %>% 
#   distinct() %>% 
#   group_by(code_parametre,annee) %>% 
#   count(name="nb_station") 
#   
# note_substance_2 <- autre_station %>% left_join(autre_prelevement,by="code_station") %>% 
#   left_join(autre_analyse_tot2,by="code_prelevement") %>% 
#   mutate(annee = year(date_prelevement)) %>% 
#   select(code_parametre,annee,code_prelevement) %>% 
#   distinct() %>% 
#   group_by(code_parametre,annee) %>% 
#   count(name="frq_prelevement") 
# 
# note_substance <- note_substance %>% 
#   left_join(note_substance_2,by=c("code_parametre","annee")) %>% 
#   inner_join(autre_parametre,by="code_parametre") %>% 
#   mutate(note_station = ifelse(nb_station<20,0,
#                               ifelse(nb_station<50,1,
#                                      ifelse(nb_station<100,2,3)))) %>% 
#   mutate(frq_prvlt = frq_prelevement/nb_station) %>% 
#   mutate(note_frq = ifelse(frq_prvlt<2,0,
#                               ifelse(frq_prvlt<6,1,
#                                      ifelse(frq_prvlt<10,2,3)))) %>% 
#   ungroup() %>% 
#   select(code_parametre,note_station,note_frq,annee) %>% 
#   mutate(note_total_substance = ifelse(note_station + note_frq>4,"forte",
#                                  ifelse(note_station + note_frq>2,"moyen",
#                                         "faible")))
# 
# remove(note_substance_2)
# 
# DT::datatable(note_substance,caption = "Notes des différentes substances sur stations référentes")
# 
# 
# note_substance$note_total_substance <- as.factor(note_substance$note_total_substance)
# ggplot(note_substance, aes(annee, nb_substance, fill=note_total_substance))+
#     geom_bar(stat="identity") +
#     geom_text(aes(label=nb_substance), vjust=-12, size=3, hjust=1)

autre_analyse_tot2 <- autre_analyse_tot %>% select(-c(date_prelevement,code_station))

note_substance <- autre_station %>% left_join(autre_prelevement,by="code_station") %>% 
  left_join(autre_analyse_tot2 ,by="code_prelevement") %>% 
  mutate(annee = year(date_prelevement)) %>% 
  select(code_parametre,annee,code_station) %>% 
  distinct() %>% 
  group_by(code_parametre,annee) %>% 
  count(name="nb_station") 
  
note_substance_2 <- autre_station %>% left_join(autre_prelevement,by="code_station") %>% 
  left_join(autre_analyse_tot2,by="code_prelevement") %>% 
  mutate(annee = year(date_prelevement)) %>% 
  select(code_parametre,annee,code_prelevement) %>% 
  distinct() %>% 
  group_by(code_parametre,annee) %>% 
  count(name="frq_prelevement") 

note_substance_3 <- autre_station %>% left_join(autre_prelevement,by="code_station") %>% 
  left_join(autre_analyse_tot2,by="code_prelevement") %>% 
  mutate(annee = year(date_prelevement)) %>% 
  select(code_parametre,annee) %>% 
  distinct() %>% 
  group_by(annee) %>% 
  count(name="nb_substance") 

note_substance <- note_substance %>% 
  left_join(note_substance_2,by=c("code_parametre","annee")) %>% 
  inner_join(parametre,by="code_parametre") %>% 
  mutate(note_station = ifelse(nb_station<20,0,
                              ifelse(nb_station<50,1,
                                     ifelse(nb_station<100,2,3)))) %>% 
  mutate(frq_prvlt = frq_prelevement/nb_station) %>% 
  mutate(note_frq = ifelse(frq_prvlt<2,0,
                              ifelse(frq_prvlt<6,1,
                                     ifelse(frq_prvlt<10,2,3)))) %>% 
  ungroup() %>% 
  select(code_parametre,note_station,note_frq,annee) %>% 
  mutate(note_total_substance = ifelse(note_station + note_frq>4,"forte",
                                 ifelse(note_station + note_frq>2,"moyen",
                                        "faible"))) %>% 
  left_join(note_substance_3,by="annee") 

remove(note_substance_2)

DT::datatable(note_substance,caption = "Notes des différentes substances sur stations référentes")


note_substance$note_total_substance <- as.factor(note_substance$note_total_substance)
# ggplot(data=note_substance, aes(annee))+
#   geom_bar(aes(fill=as.factor(note_total_substance)), position="fill")

# ggplot(data=note_substance,
#        aes(x=annee,y=(..count..)/sum(..count..),
#            fill = note_total_substance)) + 
#   geom_bar(width = 0.9) +
#    geom_text(aes(label=nb_substance), vjust=0)

ggplot(note_substance, aes(annee, nb_substance, fill=note_total_substance))+
    geom_bar(stat="identity") +
    geom_text(aes(label=nb_substance), vjust=-12, size=3, hjust=1)
```

Avec le nombres de substances analysée par années.

## {-}

## Depassement du PNEC  {.tabset .tabset-pills}

### Cote à cote  : 

```{r}
ref_PNEC <- ref_PNEC %>%  mutate(referentes = TRUE)
autre_PNEC <- autre_PNEC %>%  mutate(referentes = FALSE)
# PNEC <- ref_PNEC %>% full_join(autre_PNEC,by="code_parametre") %>% 
#   ungroup() %>% 
#   mutate(nom_parametre = ifelse(!is.na(nom_parametre.x),nom_parametre.x,nom_parametre.y)) %>% 
#   select(-nom_parametre.x,-nom_parametre.y) %>% 
#   mutate(ref.x = TRUE, ref.y = FALSE,
#          pct.x = ifelse(is.na(pct.x),0,pct.x),
#          pct.y= ifelse(is.na(pct.y),0,pct.y)) 
PNEC <- bind_rows(autre_PNEC,ref_PNEC)

ggplot(PNEC, aes(nom_parametre, pct, fill = referentes)) +
  geom_col(position = "dodge") +
  theme(axis.text.x  = element_text(angle=90, vjust=0.5, size=16)) +
  coord_flip()


# ggplot(PNEC) +
#   geom_col(aes(nom_parametre,pct.x ),colour = "red",position = "dodge") + 
#   geom_col(aes(nom_parametre,pct.y ),colour = "blue",position = "dodge") + 
# ggtitle("Nbre de station par moy de prélevement par ans ") +
#   ylab("Nombre de stations") +
#   xlab("Nombre de prélevement par an")

```


### Sur stations referentes : 

```{r}

  
  ggplot(ref_PNEC,aes(nom_parametre,pct)) +
ggtitle("Depassement du PNEC par mois en %") +
  #ylab("Nombre de depassement annuel") +
  #xlab("Nom de la substance") +
        geom_col(na.rm=TRUE) +
  theme(axis.text.x  = element_text(angle=90, vjust=0.5, size=16)) +
  coord_flip()

```

### Sur autres stations  : 

```{r}

  ggplot(autre_PNEC,aes(nom_parametre,pct)) +
ggtitle("Depassement du PNEC par mois en %") +
  #ylab("Nombre de depassement annuel") +
  #xlab("Nom de la substance") +
        geom_col(na.rm=TRUE) +
  theme(axis.text.x  = element_text(angle=90, vjust=0.5, size=16)) +
  coord_flip()
```


## {-}


## IPCE



```{r}

autre_IPE <- IPCE_ME(param_PrioDang,autre_analyse_tot,autre_prelevement,autre_station) %>% 
  arrange(desc(Rapport_PNEC)) %>% 
  group_by(annee,code_masse_eau) %>% 
  summarise(pire_rapport_PNEC=nth(Rapport_PNEC,1),
            code_parametre = nth(code_parametre,1)) %>%
  ungroup()

```


```{r}
ref_IPCE <- IPCE_ME(param_PrioDang,ref_analyse_tot,ref_prelevement,ref_station) %>% 
  arrange(desc(Rapport_PNEC)) %>% 
  group_by(annee,code_masse_eau) %>% 
  summarise(pire_rapport_PNEC=nth(Rapport_PNEC,1),
            code_parametre = nth(code_parametre,1)) %>%
  ungroup() %>% 
  filter(pire_rapport_PNEC > 0.5)

```

## Depassement du NQE_CMA et NQE_MA : {.tabset .tabset-pills}

### Station REF 

```{r}
ref_count_nqe_depass <- ref_count_nqe_depass %>% mutate(type_depassement = "MA") #%>% 
  
ref_count_nqe_CMA_depass <- ref_count_nqe_CMA_depass %>% mutate(type_depassement = "CMA") #%>% 
  
ref_view_nqe_depass <- rbind.data.frame  (ref_count_nqe_depass,ref_count_nqe_CMA_depass)


ggplot(ref_view_nqe_depass,aes(nom_parametre,tx_depass)) + #, fill = type_depassement
ggtitle("Depassement du NQE pic pour une molécule sur une station") +
  ylab("Nombre de depassement annuel") +
  xlab("Nom de la substance") +
        geom_col(na.rm=TRUE) + coord_flip() +
  facet_wrap(~type_depassement) +
        geom_text(aes(label=nb_anal), vjust=0) 

# IPCE_tot_tx_ME <- IPCE_tot %>% left_join(station %>% select(code_station,code),by="code_station") %>% 
#   group_by(annee,code) %>% mutate(Rapport_PNEC = mean(Rapport_PNEC) ) %>% select(code,annee,Rapport_PNEC) %>% 
#   ungroup() %>%   distinct() %>% 
#   arrange(code,annee) %>% 
#   group_by(code) %>% mutate(calcul_base_100 = first(Rapport_PNEC)) %>% 
#   ungroup() %>% 
#   group_by(annee,code) %>%  mutate(base_100 = Rapport_PNEC/calcul_base_100 * 100) %>% 
#   left_join(nb_SAGE_prvlt_par_an,by=c("code","annee"))

```

### Station Non-REF 


```{r}

autre_count_nqe_depass <- autre_count_nqe_depass %>% mutate(type_depassement = "MA") #%>% 
  
autre_count_nqe_CMA_depass <- autre_count_nqe_CMA_depass %>% mutate(type_depassement = "CMA") #%>% 
  
autre_view_nqe_depass <- rbind.data.frame  (autre_count_nqe_depass,autre_count_nqe_CMA_depass)

ggplot(autre_view_nqe_depass,aes(nom_parametre,tx_depass)) + #, fill = type_depassement
ggtitle("Depassement du NQE pic pour une molécule sur une station") +
  ylab("Nombre de depassement annuel") +
  xlab("Nom de la substance") +
        geom_col(na.rm=TRUE) + coord_flip() +
  facet_wrap(~type_depassement) +
        geom_text(aes(label=nb_anal), vjust=0) 

```

{-}


## Le seqEau : 


### Station REF 

```{r}

plot(graphe_ref)

```

### Station Non-REF 


```{r}

plot(graphe_non_ref)


```



```{r}


```
